줄루아에서는 텍스트가 두 가지 서로 다른 아키텍처적 요소를 통해 처리됩니다: 32비트 문자 기본 타입과 불변인, UTF-8 인코딩된 문자열다른 언어에서 문자는 길이가 1인 문자열로 간주되는 것과 달리, 줄루아는 문자 Unicode 코드 포인트를 나타내는 일급 수치형 타입으로 간주합니다.
1. 타입 계층 구조 및 메모리
구체적인 문자 은 $32$비트 기본 타입이며 ( AbstractChar의 서브타입입니다). 내장된 문자열 은 ( AbstractString의 서브타입)은 전체 유니코드 범위를 지원합니다. 한편, 문자 은 고정 크기이고, 문자열 문자열은 가변 너비입니다. 개별 문자는 1~4바이트를 차지하며, 아스키 전환 지점은 $0x80(128)$입니다.
2. 산술 연산 및 비교
문자 문자 은 수치적 코드 포인트를 나타내므로 산술 연산을 수행할 수 있습니다. 다음과 같이 사용하세요: Int('a') 를 사용하면 97을 얻고, Char(97) 를 사용하면 'a'를 얻을 수 있습니다. 사전식 비교도 지원됩니다: 'X' < 'x' 이는 유니코드에서 대문자가 소문자보다 먼저 오기 때문에 참입니다.
| 특성 | 문자 ('a') | 문자열 ("a") |
|---|---|---|
| 타입 | 문자 | 문자열 |
| 크기 | 고정 $32$-비트 | 가변 UTF-8 |
| 가변성 | 없음 (값 형식) | 아니요 (불변) |
예를 들어, 'A' <= 'X' <= 'Y' 는 참 또는 거짓 유니코드 순서에 따라 평가됩니다.
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>